home *** CD-ROM | disk | FTP | other *** search
/ TIME: Almanac 1993 / TIME Almanac 1993.iso / time / 012990 / 0129209.000 < prev    next >
Encoding:
Text File  |  1992-08-28  |  9.5 KB  |  194 lines

  1.                                                                                 BUSINESS, Page 58Ghost in the Machine
  2.  
  3.  
  4. The nine-hour breakdown of AT&T's long-distance telephone
  5. network dramatizes the vulnerability of complex computer systems
  6. everywhere
  7.  
  8. By PHILIP ELMER-DEWITT -- Reported by Thomas McCarroll/New York
  9. and Paul A. Witteman/San Francisco
  10.  
  11.  
  12.     The first sign that something had gone haywire in AT&T's
  13. long-distance telephone network came at 2:25 p.m. last Monday,
  14. when the giant map of the U.S. in the company's operations
  15. center in New Jersey began to light up like a football
  16. scoreboard. For reasons still being investigated, a computer in
  17. New York City had come to believe it was overloaded with calls,
  18. and it started to reject them. Alerted to New York's troubles,
  19. dozens of backup computers across the U.S. automatically
  20. switched in to take up the slack -- only to exhibit the same
  21. bizarre symptoms. People trying to place long-distance calls all
  22. over the world suddenly began to hear busy signals and recorded
  23. messages blandly informing them that "all circuits" were busy.
  24.  
  25.     Thus began the worst computer breakdown in the history of
  26. the U.S. telephone system. The incident was also a vivid
  27. reminder of how susceptible America, and the world, has become
  28. to computer failures -- natural and man-made. In 20 years of
  29. intensive automation, everything from supermarkets to stock
  30. exchanges has been computerized. Last week businesses and
  31. consumers were forced to face up to a downside of technology
  32. that becomes apparent only when the new systems fail. Said
  33. Steven Idelman, chairman of Omaha-based Idelman Telemarketing:
  34. "When things go wrong in a computer environment, they go wrong
  35. in a big way."
  36.  
  37.     Things stayed wrong at AT&T for nine hours last week. Of the
  38. 148 million long-distance and 800-number calls placed with the
  39. company that day, only 50% got through. Hotels lost bookings.
  40. Cars went unrented. The number of calls to the American Airlines
  41. reservation system fell two-thirds. Idelman had to send 800
  42. phone workers home for the day; he estimates he lost about
  43. $75,000 in sales. All told, the breakdown cost AT&T some $60
  44. million to $75 million in lost revenues. Said AT&T Chairman
  45. Robert Allen: "It was the worst nightmare I've had in 32 years
  46. in the business."
  47.  
  48.     Phone-company technicians traced the problem to a single
  49. "failure of logic" in the computer programs that route calls
  50. through the AT&T network. Like many programming bugs, it stemmed
  51. from an improvement on the original system. By carrying
  52. information about who is calling whom on a separate channel, or
  53. band, from the call signal itself, AT&T has been able to reduce
  54. the time between dialing and ringing from as much as 20 seconds
  55. to as little as four seconds. But the refinement inadvertently
  56. made the system more prone to breakdowns. Last week's glitch
  57. spread rapidly among the 114 computers in AT&T's network in part
  58. because they all contained the same programming error.
  59.  
  60.     The collapse of its network came at a time of increased
  61. vulnerability for AT&T. Although Ma Bell still carries 70% of
  62. the U.S.'s long-distance traffic (down from 90% five years ago),
  63. it has been fighting a rearguard action to keep its customers
  64. from defecting to its feisty competitors, MCI and US Sprint. The
  65. glitch simultaneously deflated AT&T's multimillion-dollar
  66. "reliability" advertising campaign and handed its competitors
  67. a once-in-a-career sales pitch. "An important message to
  68. everyone whose telephone is the lifeline of their business,"
  69. began a print ad rushed out by US Sprint after the breakdown.
  70. "Always have two lifelines."
  71.  
  72.     AT&T operators made matters worse on Monday by refusing to
  73. give stranded customers instructions for calling via MCI or
  74. Sprint -- a standing order that was reversed 3 1/2 hours after
  75. the breakdown began, too late to do East Coast businesses any
  76. good. To help make amends, AT&T announced late last week that
  77. it had asked the Federal Communications Commission for
  78. permission to offer long-distance discounts to all callers on
  79. Valentine's Day. But the phone company's aura of infallibility
  80. will not be so easily repaired.
  81.  
  82.     That an operation as heavily computerized as AT&T's could
  83. have maintained such a reputation is a near miracle. To experts
  84. who track technological mishaps, the past decade reads like an
  85. unending parade of computer disasters, ranging from the
  86. humiliating bugs that delayed one space-shuttle launch after
  87. another to the Belgian stock-exchange computers that collapsed
  88. under the rush of sell orders during last October's minicrash.
  89. Computerized elevator doors have shut unexpectedly. Factory
  90. robots have started without warning, killing workers. A
  91. misprogrammed medical X-ray machine delivered fatal doses of
  92. radiation to at least three cancer patients.
  93.  
  94.     The vulnerability of all computer systems was underscored
  95. last week by separate court proceedings in California and New
  96. York. In San Jose three Silicon Valley workers were indicted for
  97. a range of computer crimes, including, for perhaps the first
  98. time, taking classified military information from Government
  99. computers. The next day a Cornell University graduate student
  100. made the first public explanation of how the rogue program he
  101. released into a research network in November 1988 managed to
  102. cripple some 6,000 university and military computers. "It was
  103. a mistake," Robert Morris said at his federal trial in
  104. Syracuse. "I'm sorry."
  105.  
  106.     But a trespassing hacker is just one of the problems that
  107. can bring a computer system to its knees. Technicians were
  108. installing extra disk drives in an underground computer in Tulsa
  109. last May when they triggered a collapse of American Airlines'
  110. SABRE reservation system. Last September a Parisian computer
  111. creatively misread magnetic labels on 41,000 traffic-violation
  112. files and began charging delinquent motorists with crimes
  113. ranging from murder and drug trafficking to prostitution. A fire
  114. in a Tokyo utility tunnel several years ago wiped out circuits
  115. connecting Mitsubishi Bank's mainframe computers with branch
  116. offices, shutting down automated-teller machines across the
  117. country for five days.
  118.  
  119.     Massive system failures dramatize the trade-off that occurs
  120. whenever a high-tech system replaces a low-tech one. Because
  121. most electronic systems are thoroughly interconnected, their
  122. failures tend to be all-or-nothing affairs. They do not, as
  123. computer scientists put it, degrade gracefully; they crash.
  124. Moreover, what is gained in speed and productivity is often lost
  125. in control, reliability and -- for lack of a better word --
  126. transparency. When a system of gears and levers stops working,
  127. its operators can roll up their sleeves, raise the hood and go
  128. to work. When a microchip goes bad, its circuits are unlikely
  129. to respond to on-the-spot ministrations.
  130.  
  131.     The risk for businesses is not so much that their systems
  132. will someday break down -- that is almost a given -- but that
  133. lingering computer anxiety in the buying public will make it
  134. harder for firms to recoup their investments in high-tech
  135. equipment and services. Banks and brokerage houses live in fear
  136. that one or two well-publicized computer failures will alienate
  137. their customer base, triggering mass defections to their
  138. competitors.
  139.  
  140.     There are ways to make the technology more reliable.
  141. Fault-tolerant computers like those built by Stratus, Tandem
  142. and, for that matter, AT&T reduce runaway system errors by a
  143. kind of "paranoid democracy," where modules working in parallel
  144. constantly evaluate whether their electronic co-workers are
  145. "sane" or "crazy." Unfortunately, as last week's breakdown
  146. showed, it is possible for all the modules to go crazy at once.
  147. Software, always the skittish part of any system, can also be
  148. made more dependable by imposing the kind of discipline on
  149. programmers that engineering standards impose on, say, bridge
  150. designers. A program like AT&T's faulty switching system,
  151. however, which can contain a million lines of code, is more
  152. complex than any bridge. "Standards have not been developed,"
  153. says Donn Parker, a senior management consultant at SRI
  154. International. "Software is not predictable."
  155.  
  156.     But automation is certain to become ever more pervasive. If
  157. U.S. firms do not develop the most advanced systems, Japanese
  158. or South Korean or European companies are sure to do so.
  159. "American industry faces an extremely competitive situation,"
  160. says Tandem President James Treybig. "AT&T is fighting to be in
  161. the forefront of technology, and there is some cost to staying
  162. in front." If Treybig is right, temporary setbacks are just the
  163. price of progress. But incidents like last week's are sure to
  164. influence the priorities of technology shoppers: reliability
  165. will be just as important as clever ads and fancy features.
  166.  
  167.  
  168. _________________________________________________________________
  169. BUGS, GLITCHES AND SNAFUS
  170.  
  171.  
  172.     -- During a payday rush last year, a faulty program shut
  173. down 1,800 automated-teller machines at Tokyo's Dai-Ichi Kangyo
  174. Bank.
  175.  
  176.     -- When an airline's reservation system went down last
  177. year, 14,000 travel agents had to book flights manually.
  178.  
  179.     -- MasterCard processes more than 200,000 credit approvals
  180. on a typical day, so the phone breakdown wreaked havoc.
  181.  
  182.     -- The Dallas/Fort Worth air-traffic system began spitting
  183. out gibberish last fall and controllers had to track planes on
  184. paper.
  185.  
  186.     -- In the early 1980s, Buick had to give 80,000 V6 cars a
  187. chip transplant to fix flaws in their microprocessors.
  188.  
  189.     -- The U.S.S. Vincennes downed an Iranian airliner when the
  190. ship's crew misread a computer display.
  191.  
  192. 
  193.  
  194.